ocrmypdf -l chi_sim --tesseract-oem 1 --tesseract-pagesegmode 6 data\input_1.pdf data\output_2.pdf